\section{问题一的模型建立与求解}
\begin{figure}[H]
	\centering
	\includegraphics[width=0.95\textwidth]{问题一思路}
	\caption{问题一流程}
	\label{fig:问题一流程}
\end{figure}
	\subsection{表面分化与纹饰、玻璃类型、颜色的相关性分析}
	分析表单1可知，表面分化、纹饰、玻璃类型以及颜色并不符合标准正态分布，故无法运用Pearson检验法，	而Spearman相关性分析是一种用于变量不符合正态分布，或变量分布类型未知时的相关性分析方法。其公式如\cref{eq:spearman}，正适用于表单1中数据分布情况。
	\begin{equation}
		r_s = \frac{\sum \left( R_X - \overline{R_X} \right) \left( R_Y - \overline{R_Y} \right)}{\sqrt{\sum \left( R_X - \overline{R_X} \right)^2 \sum \left( R_Y - \overline{R_Y} \right)^2}}
		\label{eq:spearman}
	\end{equation}
	
	对预处理后的数据进行数据编码，将抽象名词编码为可以定量分析的案例数据。转化后的结果如\cref{编码表}所示。对编码数据进行Species相关性分析，得到结果于\cref{相关性结果表}，若结果小于0.05，则具备相关性。\textbf{结果证明：纹饰与颜色对于玻璃表面是否风化无相关性，玻璃类型对于玻璃表面是否存在风化存在相关关系。}
	\begin{table}[htbp]
		\centering 
		\caption{变量编码表} 
		\label{编码表}
		\begin{tabular}{| *{2}{w{c}{2cm}}|*{2}{w{c}{2cm}}| }
			\hline
			纹饰 &  & 颜色 & \\ \hline
			A & 1& 浅蓝 & 1\\ 
			B & 2&  深蓝& 2\\ 
			C    & 3     &  蓝绿    &3   \\ \cline{1-2}
			类型&  &  浅绿&4 \\ \cline{1-2}
			高钾&  1&  深绿&5 \\ 
			铅钡&  2&  绿& 6\\ \cline{1-2}
			表面风化&  &  紫&7 \\ \cline{1-2}
			风化&  1&  黑& 8\\ 
			未风化&  2&  & \\ 
			\hline
		\end{tabular}
	\end{table}

	\begin{table}[htbp]
		\centering 
		\caption{相关性结果表} 
		\label{相关性结果表}
		\begin{tabular}{| *{4}{w{c}{2cm}}| }
			\hline
			 &  纹饰& 颜色 &玻璃类型 \\ \hline
			表面风化& 0.384& 0.421& 0.008\\ 
			\hline
		\end{tabular}
	\end{table}

	\subsection{玻璃表面化学成分含量统计规律分析}
	题目要求分析不同玻璃类型有无风化化学成分的统计规律，本文依据表单1将表单2中的数据分为4大类别：高钾风化、高钾无风化、铅钡风化、铅钡无风化，再分别讨论此四类玻璃文物表面化学成分含量的统计规律，即分析均值、方差、变异系数、偏度系数、峰度系数等统计量。
	\begin{enumerate}[label={\textbf{(\arabic*)}}]
		\item \textbf{变异系数}
		
		变异系数($CV$)可以衡量数据的离散程度（相对波动性），分析不同量级的数据集，其公式为\cref{eq:cv},其中，\(\sigma\) 为标准差，\(\mu\) 为均值。
		\begin{equation}
			CV = \frac{\sigma}{\mu} \times 100\%
			\label{eq:cv}
		\end{equation}
		
		\item \textbf{偏度系数}
		
		偏度系数($\beta_s$)用来描述数据分布的不对称性。其公式为\cref{eq:skewness},若偏度 \(> 0\)，分布右偏；若 \(< 0\)，左偏；若 \(\approx 0\)，对称。
		\begin{equation}
			{\beta_s} = \frac{E[(X - \mu)^3]}{\sigma^3}
			\label{eq:skewness}
		\end{equation}
		\item \textbf{峰度系数}
		
		峰度系数($\beta_k$)可以衡量分布的峰态（相比正态分布），其公式为\cref{eq:kurtosis},正态分布的峰度为 \(0\)。
		\begin{equation}
			{\beta_k} = \frac{E[(X - \mu)^4]}{\sigma^4} - 3
			\label{eq:kurtosis}
		\end{equation}
	\end{enumerate}
	

	利用python求出四大类别的统计量如\cref{统计分析结果}（仅列出未风化铅钡组，其余见附件）

	\begin{table}[htbp]
		\centering
		\caption{未风化铅钡组统计量结果表}
		\label{统计分析结果}
		\begin{tabular}{ccccccc}
			\hline
			成分 & 均值 & 方差 & 变异系数 & 偏度 & 峰度  \\
			\hline
			二氧化硅(SiO2) & 54.66 & 139.916 & 0.216 & -0.371 & -0.538  \\
			氧化钠(Na2O) & 1.683 & 5.625 & 1.409 & 1.287 & 0.758  \\
			氧化钾(K2O) & 0.219 & 0.096 & 1.418 & 2.883 & 10.061  \\
			氧化钙(CaO) & 1.32 & 1.65 & 0.973 & 1.347 & 1.03  \\
			氧化镁(MgO) & 0.64 & 0.299 & 0.854 & 0.085 & -1.241  \\
			氧化铝(Al2O3) & 4.456 & 10.644 & 0.732 & 1.988 & 4.233  \\
			氧化铁(Fe2O3) & 0.737 & 1.333 & 1.568 & 2.072 & 4.768  \\
			氧化铜(CuO) & 1.432 & 3.88 & 1.376 & 2.461 & 6.877  \\
			氧化铅(PbO) & 22.085 & 67.489 & 0.372 & 0.62 & -0.456  \\
			氧化钡(BaO) & 9.002 & 33.934 & 0.647 & 1.797 & 3.758 \\
			五氧化二磷(P2O5) & 1.049 & 3.412 & 1.761 & 2.167 & 3.724  \\
			氧化锶(SrO) & 0.268 & 0.059 & 0.908 & 1.231 & 1.96  \\
			氧化锡(SnO2) & 0.047 & 0.016 & 2.737 & 2.634 & 5.816  \\
			二氧化硫(SO2) & 0.159 & 0.582 & 4.796 & 4.796 & 23  \\
			\hline
		\end{tabular}
	\end{table}

	通过对计算结果分析可知，未风化铅钡类别中SiO₂呈左偏分布且稳定性最高，而Na₂O等11种成分呈现右偏特征，其中SO₂的偏度和峰度均显著偏高，表明存在极端高值。MgO则接近对称分布；从波动性看，SO₂和P₂O₅变异系数最大，反映出较强的环境敏感性；SiO₂和PbO最为稳定。而风化铅钡类别，Na₂O、K₂O和SO₂等成分具有较高的偏度和峰度值，其中SO₂的偏度达3.26、峰度达9.63，且变异系数为3.08，显示出明显的右偏分布和极端值特征，表明这些成分对环境变化较为敏感。相比之下，SiO₂和PbO的变异系数较低（分别为0.43和0.28），偏度接近0，分布较为对称稳定。特别值得注意的是SnO₂的峰度高达19.79，变异系数3.94，表明其数据存在显著异常值。这些差异为研究文物成分特征提供了重要依据，高波动性成分如SO₂和SnO₂可作为风化程度的重要指标，而SiO₂等稳定成分则更适合用于文物原始组成的分析。

	未风化高钾类别中SnO2表现最为突出，偏度3.46、峰度12、变异系数3.46，具有明显的右偏和极端值特征。Na2O、PbO和P2O5等成分偏度1.37-1.68，呈现右偏特征，其中Na2O和PbO变异系数分别达1.85和1.43，波动性较强。K2O和CaO呈现左偏分布（偏度-1.20和-0.88），可能低值样本较多。SiO2虽然偏度1.16呈右偏，但变异系数最低（0.13），稳定性最好；Al2O3和CuO偏度接近0（0.48和0.10），分布对称。Fe2O3偏度1.18但峰度2.57，呈现一定尖峰特征。而风化高钾类别中该数据集中各成分呈现出显著不同的分布特征。SiO2表现出极高的稳定性（均值93.96，变异系数0.02），其偏度0.85显示轻微右偏，峰度-0.39表明分布略平坦。Na2O、PbO、BaO、SrO、SnO2和SO2在所有统计量上均显示为0值，表明这些成分可能未被检测到或含量低于检测限。K2O（偏度-0.54）和Fe2O3（偏度-0.30）呈现左偏分布，而MgO（偏度1.01）和CuO（偏度1.22）则显示右偏特征。值得注意的是，CuO的峰度达到2.23，表现出明显的尖峰分布，暗示可能存在异常值。CaO和Al2O3的偏度分别为0.50和0.78，呈现温和的右偏分布。P2O5的各项指标均处于中间水平，剩余组别峰度和偏度均为0，说明其为正态分布。

	\subsection{预测风化前化学成分}
	根据上一小问求出的四大类别化学成分的均值，为了直观展现，做出\cref{fig:化学成分均值}。
	\begin{figure}[H]
		\centering
		\includegraphics[width=0.8\textwidth]{文物成分均值_柱状图.png}
		\caption{各类别化学成分均值}
		\label{fig:化学成分均值}
	\end{figure}

	计算同一玻璃类别在风化前后化学成分均值的差异，对结果进行可视化操作以直观展现化学成分的变化。变化如\cref{fig:风化前后变化}。
	\begin{figure}[H]
		\centering
		\includegraphics[width=0.8\textwidth]{风化成分_前五变化柱状图.png}
		\caption{风化前后成分变化}
		\label{fig:风化前后变化}
	\end{figure}

	\subsubsection{贝叶斯优化}
	贝叶斯优化是一种基于贝叶斯理论的序贯优化方法，特别适用于目标函数计算代价高、非凸、导数难以获取的问题。其核心思想是通过构建一个代理模型（Surrogate Model）来逼近目标函数，并利用采集函数（Acquisition Function）指导下一步采样点。

		\textbf{Step 1)} 构造目标函数$\mathcal{L}(x)$
		
		定义优化过程中的目标函数为\cref{eq:贝叶斯_目标函数}。
		\begin{equation}
			\mathcal{L}(x) = \tfrac{|x - \mu_u|}{\mu_u} + 0.5 \left| w - x \cdot \tfrac{\mu_w}{\mu_u} \right| + 0.3 |\text{CV}_u - \text{CV}_w| \\[5pt]
			\label{eq:贝叶斯_目标函数}
		\end{equation}
		
		其中$\tfrac{|x-\mu_u|}{\mu_u}$为预测值和未风化成分均值的标准化误差，$| w - x \cdot \tfrac{\mu_w}{\mu_u} |$为预测值$x$通过风化比例$\tfrac{\mu_w}{\mu_u}$转换后，与实际风化值$w$的绝对偏差，$|{CV}_u - {CV}_w|$表示未风化与风化成分的变异系数差异。
		
		优化目标为\cref{eq:贝叶斯_优化目标}。
		\begin{equation}
			x^* = \mathop{\arg\min}\limits_{x \in [a,b]} \mathcal{L}(x)
			\label{eq:贝叶斯_优化目标}
		\end{equation}
		
		即在优化过程中，找到使目标函数$\mathcal{L}(x)$最小的x，即为最优反演值。

		\textbf{Step 2)} 确立代理模型

		目标函数$\mathcal{L}(x)$的代理模型为\cref{eq:贝叶斯_代理模型}，在优化过程中$\mathcal{L}(x)$服从均值为0的高斯过程，其核函数为平方指数核（RBF核）。
		\begin{equation}
			\mathcal{L}(x) \sim \mathcal{GP}\left(0,\, \sigma^2 \exp\left(-\tfrac{(x-x')^2}{2l^2}\right)\right) \\[5pt]
			\label{eq:贝叶斯_代理模型}
		\end{equation}
		
		其中$\sigma^2$表示差参数，控制函数的整体波动幅度，$l$是长度尺度参数，决定函数变化的平滑程度（$l$越大，函数越平缓），$\exp(-\tfrac{(x-x')^2}{2l^2})$用于衡量$x$和$x'$两点间的相似性，距离越近相关性越强。

		\textbf{Step 3)} 添加约束条件
		
		在优化过程中，将搜索空间约束为\cref{eq:贝叶斯_约束条件}。
		\begin{equation}
			x \in [\max(0, 0.7x_b), \min(100, 1.3x_b)]
			\label{eq:贝叶斯_约束条件}
		\end{equation}
		
		将搜索空间限制在基础预测值的±30\%范围内，同时约定化学成分上下界（0$\sim$100）。此外基于化学常识，对优化过程中做出以下物理化学约束：1.SiO₂流失不超过80\%,2.SO₂增加不超过20\%。

	\subsubsection{优化预测结果}
	依据上述条件对风化后的化学物质进行贝叶斯推演，得到\textbf{预测结果展示于下表}（仅展示部分，其余见附件）
	\begin{table}[htbp]
		\centering
		\caption{高钾玻璃风化点预测}
		\label{tab:high_k_glass}
		\begin{tabular}{lccccccccc}
		\toprule
		采样点 & \( \text{SiO}_2 \) & \( \text{Na}_2\text{O} \) & \( \text{K}_2\text{O} \) & \( \text{CaO} \) & \(\cdots\) & \( \text{P}_2\text{O}_5 \) & \( \text{SrO} \) & \( \text{SnO}_2 \) & \( \text{SO}_2 \) \\
		\midrule
		02     & 69.63 & 0    & 6.32  & 3.29  & \(\cdots\) & 3.57  & 0.17 & 0    & 0 \\
		08     & 73.92 & 0    & 6.26  & 2.95  & \(\cdots\) & 2.58  & 0.15 & 0    & 0 \\
		\(\cdots\)& & & & & & & & & \\
		58     & 63.31 & 0    & 0.37  &  1.62 & \(\cdots\) & 1.70   & 0.19 & 0    & 0 \\		\bottomrule
		\end{tabular}
	\end{table}
	
	为了更加直观的展现风化前后化学成分的变化，将代表性采样点08化学成分变化制成折线图展示如\cref{fig:样本点前后变化}。
	\begin{figure}[H]
		\centering
		\includegraphics[width=0.95\textwidth]{样本成分变化折线图.png}
		\caption{样本点前后成分变化}
		\label{fig:样本点前后变化}
	\end{figure}

	与此同时，对得到的结果进行检验来进一步验证结果的合理性。{\color{red}暂时忽略}